Yiksan0315's Blog

MLE

  • or
  • Maximum Likelihood Estimation,
  • 최대 우도법

# Tag:

  • Source/KU_ML

MLE(Maximum Likelihood Estimaion)

training data에서 가 관측될 확률이 최대가 될 때의 를 찾아내는 방법으로 Parametric Methods의 일종이다.

Posterior를 찾아내는데 있어 Prior을 아는 것을 힘드므로, Prior를 균일하게 두고 이에 따라 Likelihood를 최대가 되게 하여 Posterior를 커지게 하는 방법이다. 이는 MAP에서 Prior를 균등 분포로 두느냐에 차이라고도 할 수 있다.

Likelihood :
⇒ IID samples 에 대하여 likehood를 추정하는 것으로, 독립에 의해 Multiplication Rule이 적용 가능하다.

이 중, 를 구하는 것이므로, log를 씌워도 동일하다. 따라서 곱이 합으로 나타난다.

보통 에 대해 미분해 극점을 찾지만, 항상 극대점이라는 보장이 없으므로 분포에 따라 이계도함수까지 확인을 하거나, 다른 최적화 기법을 활용해야 할 수도 있다.

MLE for Bernoulli Distribution

성공의 확률이 가 parameter이므로,

와 같이 Parametric Methods방법을 따라 분포를 정해놓고 전개된다.

이 때, Lagrange function:
이를 최소화하기 위한 convex를 찾으면,

은 총 데이터의 개수.

MLE for Multinoulli Distribution

: Lagrange Multiplier를 이용해, 의 합이 1임을 constraints로 하는 convex optimizaiton을 해결한다.

for Supervised Learning

: 는 one-hot vector이다.

: 들 끼리는 IID함을 가정한다.

라 할 때,

  • : 에 대한 parameter set.
  • : 에 대한 paratmeter set.

: 에 대해서, 0인 경우는 의미가 없으므로 1인 경우에만 대해 합산한다.

이에 대한 convec optimization을 구하면

  • :
  • :

MLE for Gaussian Distribution

위에서 는 최적화 대상이 아니므로, 제외하고 생각한다.

이에 대한 convec optimization을 구하면

  • ; sample mean
  • ; sample variance

for Supervised learning

  • class에 대해서, 번째 feature에 대한 paramter들이 된다.

MLE for MVN

이에 대한 convex optimization을 구하면

for Supervised Learning

  • : class의 Covariance
  • : classs의 Expectation
toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.